-
1 numérisation en mode texte
Deux méthodes sont possibles pour numériser un livre en mode texte. On peut saisir le livre de bout en bout sur le clavier de son ordinateur. On peut aussi scanner le livre page après page, ce qui donne des fichiers numérisés en mode image, puis on utilise un logiciel OCR (optical character recognition), qui permet de convertir chaque fichier image en fichier texte. Il est ensuite préférable de relire le contenu du fichier texte au regard de l’original (image scannée ou livre imprimé) en corrigeant les erreurs (dix erreurs par page en moyenne lorsque le logiciel OCR est de qualité). Dans l’un comme l’autre cas (saisie ou scannage + OCR), le texte numérisé apparaît en continu à l’écran, et la présentation de la page originale n’est pas conservée. A cause du temps passé au traitement de chaque livre, la numérisation en mode texte est assez longue. Elle est toutefois très préférable à la numérisation en mode image, puisqu’elle permet l’indexation, la recherche plein texte, l’analyse textuelle, une étude comparative entre plusieurs textes ou plusieurs versions du même texte, etc. C’est la méthode utilisée par exemple par le Projet Gutenberg, la grande bibliothèque mondiale au format texte fondée en 1971. Le format de fichier obtenu est le format TXT, et l’extension du fichier est ".txt".Voir aussi: bibliothèque numérique, indexation, numérisation, numérisation en mode image, OCR, Projet Gutenberg, scanner, TXT. -
2 mode
I.mode1 [mɔd]1. feminine noun2. invariable adjectiveII.mode2 [mɔd]1. masculine nouna. ( = moyen) mode• je ne comprends pas le mode de fonctionnement de cette organisation I don't understand how this organization works• quel est le mode d'action de ce médicament ? how does this medicine work?2. compounds* * *
I mɔdnom masculin1) ( façon) way, mode2) Linguistique mood3) Musique, Informatique, Philosophie mode•Phrasal Verbs:
II mɔd1) (en matière d'habillement, d'idées) fashionà la mode — [vêtement, restaurant, style] fashionable; [romancier] who is in vogue (épith, après n); [chanteur] popular
être à la mode — [vêtement, style] to be in fashion
2) ( secteur d'activité) fashion industry* * *mɔd1. nf1) (= tendance) fashionà la mode — fashionable, in fashion
2) (= industrie) fashion trade, fashion industry2. nm1) (= manière) modemode de faire — way of going about things, way of doing things
2) LINGUISTIQUE mood3) INFORMATIQUE modemode dialogué — interactive mode, conversational mode
4) MUSIQUE mode* * *A nm1 ( façon) way, mode; mode de pensée/vie way of thinking/life; mode de gouvernement mode of government; mode de transport mode of transport GB ou transportation US; mode de paiement method of payment; le mode de fonctionnement de qch the way sth operates; traiter le sujet sur le mode comique/poétique to treat the subject in a comic/poetic vein;2 Ling mood;B nf1 (en matière d'habillement, d'idées) fashion; c'est la mode it's the fashion; c'est une mode it's a trend; lancer une mode to start a trend; une mode passagère a fad; c'est passé de mode it's gone out of fashion; elle suit/ne suit pas la mode she follows/ignores fashion; s'habiller à la dernière mode to wear the latest fashions; la mode des cheveux longs/mini-jupes the fashion for long hair/mini-skirts; la mode est aux cheveux courts short hair is in fashion; c'était une mode it was fashionable; mode masculine/féminine men's/women's fashion; coupe/coloris mode fashionable cut/colourGB; à la mode ( qui fait la mode) [vêtement, style] fashionable, in fashion; [thème, personnage] in fashion; ( qui suit la mode) [vêtement, personne] fashionable; [jeune] fashionable, trendy; ( populaire) [romancier] who is in vogue ( épith, après n); [chanteur] popular; c'est très à la mode d'être végétarien it's very fashionable to be a vegetarian; la mode est à la cuisine végétarienne vegetarian cooking is all the rage ou is in fashion;2 ( secteur d'activité) fashion industry; travailler dans la mode to work in the fashion industry ou business; présentation de mode fashion show.mode dialogué Ordinat conversational mode; mode d'emploi ( de machine) instructions (pl) ou directions (pl) for use; ( de plat cuisiné) cooking instructions (pl).I[mɔd] nom féminin1. [vêtement]la mode (de) printemps/(d')hiver the spring/winter fashionla mode courte/longue (fashion for) high/low hemlinesc'est la dernière ou c'est la grande mode it's the latest fashionc'est passé de mode it's out of fashion, it's no longer fashionablelancer une mode to set a fashion ou a trend2. [activité]a. [généralement] the fashion industry ou businessb. [stylisme] fashion designing3. [goût du jour] fashionce n'est plus la mode de se marier marriage is outdated ou has gone out of fashion————————[mɔd] adjectif invariable————————à la mode locution adjectivale[personne, sport] fashionable[chanson] (currently) popular————————à la mode locution adverbialeà la mode de locution prépositionnelle1. [suivant l'usage de] in the fashion of2. (locution)II[mɔd] nom masculin1. [méthode]a. [méthode] mode ou method ofb. [manière personnelle] way ofmode d'action form ou mode of actionmode d'emploi directions ou instructions for usemode de paiement mode ou method of paymenta. [généralement] life style3. INFORMATIQUE modemode autonome ou local ou hors ligne off-line modemode connecté ou en ligne on-line mode -
3 texte électronique
Un texte électronique peut être produit directement sous forme numérique ou alors numérisé à partir d’un document imprimé. Le format de base est le format TXT (text, défini par l’extension de fichier ".txt") qui, s’il n’est pas toujours très attractif pour le lecteur (pas de paramétrage), a l’avantage d’être lisible sur tout type de machine, plateforme et logiciel. Le texte électronique a plusieurs qualités essentielles: un fichier peu volumineux, un stockage facile et une transmission rapide via l’internet. -
4 mode de texte
прил.выч. текстовой режим (канала) -
5 numérisation en mode image
Contrairement à la numérisation en mode texte, qui propose le texte d’un livre en continu, la numérisation en mode image correspond à la photographie du livre. La version informatique est le fac-similé numérique de la version imprimée. La présentation originale étant conservée, on peut feuilleter le texte page après page à l’écran. C’est la méthode employée pour les numérisations à grande échelle, par exemple pour la constitution de Gallica, la bibliothèque numérique de la Bibliothèque nationale de France (BnF). Dans le cas de Gallica, pour faciliter la recherche textuelle, les tables des matières, les sommaires et les légendes des corpus iconographiques sont numérisés en mode texte. -
6 text mode
mode m texte -
7 numérisation
La numérisation est la codification d’informations (textes, images, sons) en langage généralement binaire (0 ou 1) pour permettre leur traitement par voie informatique. La numérisation permet la création, l’enregistrement, la combinaison, le stockage, la recherche et la transmission de documents de manière simple et rapide. Des procédés similaires permettent le traitement du texte, du son et de l’image alors que, par le passé, ce traitement était assuré par des procédés différents et sur des supports différents (le papier pour l’écriture, la bande magnétique pour la musique, le celluloïd pour le cinéma). En ce qui concerne les livres, la numérisation peut être effectuée soit en mode texte, soit en mode image. -
8 Gallica
Mise en ligne en octobre 1997, Gallica est la bibliothèque numérique de la Bibliothèque nationale de France (BnF). En accès libre, elle devient rapidement l’une des plus importantes bibliothèques numériques du réseau. On y trouve les documents libres de droits du fonds numérisé de la BnF, à savoir, en février 2005, 76.000 ouvrages et 80.000 images du Moyen-Age au début du 20e siècle, avec un million de consultations par mois. Pour des raisons de coût, les documents sont essentiellement numérisés en mode image. Une petite collection de livres (1.117 titres en février 2004) est numérisée en mode texte. En février 2005, Gallica annonce la mise en ligne prochaine (entre 2006 et 2009) de l’essentiel de la presse française parue entre 1826 et 1944, à savoir 22 titres représentant 3,5 millions de pages. Début 2006, les premiers journaux disponibles en ligne sont Le Figaro (naissance en 1826), La Croix (naissance en 1883), L’Humanité (naissance en 1904) et Le Temps (naissance en 1861 et disparition en 1942). En décembre 2006, les collections comprennent 90.000 ouvrages numérisés (fascicules de presse compris), 80.000 images et des dizaines d’heures de ressources sonores. -
9 Hart, Michael
Alors qu’il est étudiant à l’Université d’Illinois (Etats-Unis), Michael Hart crée en juillet 1971 le Projet Gutenberg pour diffuser gratuitement par voie électronique le plus grand nombre possible d’oeuvres du domaine public. Au milieu des années 1990, lorsque l’utilisation du web se généralise, le Projet Gutenberg trouve un second souffle et un rayonnement international. Michael Hart décide d’y consacrer sa vie et de coordonner le travail de centaines de volontaires qui numérisent patiemment les oeuvres en mode texte dans de nombreux pays. D’abord essentiellement anglophones, les collections deviennent peu à peu multilingues. La plus ancienne bibliothèque numérique sur l’internet franchit la barre des 5.000 livres en avril 2002, des 10.000 livres en octobre 2003, des 15.000 livres en janvier 2005 et des 20.000 livres en décembre 2006, avec des milliers de volontaires dans le monde entier. Michael Hart espère franchir la barre du million de livres d’ici 2015. Michael Hart est aussi l’auteur d’un blog (Online Writings) dans lequel il développe ses idées. -
10 Projet Gutenberg
En juillet 1971, Michael Hart crée le Projet Gutenberg pour diffuser gratuitement sous forme électronique les oeuvres littéraires du domaine public. Un projet longtemps considéré par ses détracteurs comme impossible à grande échelle. Site pionnier à tous égards, le Projet Gutenberg est à la fois le premier site d’information sur un réseau encore embryonnaire et la première bibliothèque numérique. Les livres sont numérisés en mode texte (TXT) en utilisant le code ASCII (American standard code for information interchange). Lorsque l’utilisation du web se généralise, au milieu des années 1990, le projet trouve un second souffle et un rayonnement international. Les collections atteignent 1.000 livres en août 1997, 2.000 livres en mai 1999, 3.000 livres en décembre 2000, 4.000 livres en octobre 2001, 5.000 livres en avril 2002, 10.000 livres en octobre 2003, 15.000 livres en janvier 2005 et 20.000 livres en décembre 2006, dans 50 langues, avec 360 nouveaux livres par mois, 38 sites miroirs dans de nombreux pays et plusieurs dizaines de milliers de téléchargements par jour. En octobre 2001, la principale source des livres devient Distributed Proofreaders, créé par Charles Franks pour gérer la correction partagée entre volontaires. Michael Hart espère franchir la barre du million de livres d’ici 2015. D’abord essentiellement anglophones, les collections deviennent peu à peu multilingues et le Projet Gutenberg s’internationalise. Le Projet Gutenberg Europe est lancé en janvier 2004 par le Projet Rastko, basé à Belgrade, en Serbie. -
11 TXT
(text)TXT (du terme anglais "text") désigne le format texte, dont l’extension de fichier est ".txt". Ce format est le format de fichier le plus ancien, utilisé dès les débuts de l’informatique. Encodé en ASCII (American standard code for information interchange), le fichier correspondant est lisible sur toute machine, plateforme et logiciel. Ce format ne permet pas de paramétrer le texte (marges, caractères gras, soulignés ou en italique, taille et police des caractères, etc.). Les éléments importants (titres, têtes de chapitres et de sections, etc.) sont souvent mentionnés en lettres capitales. Le Projet Gutenberg par exemple, pionnier des bibliothèques numériques, diffuse des milliers d’oeuvres du domaine public au format texte, pour que celles-ci puissent être lues par tous sans problème de compatibilité. Les avantages du format texte sont sans fin. Contrairement à d’autres formats, le téléchargement d’un livre au format texte ne requiert pas de bande passante large. Un livre au format texte peut être copié à l’infini et constituer ainsi la base de dizaines de nouvelles versions numériques et imprimées. On peut corriger à tout moment les fautes d’orthographe et de grammaire et les erreurs de typographie. Le lecteur peut changer à volonté la taille et la police des caractères, les marges et le nombre de lignes par page. Les personnes malvoyantes peuvent grossir la taille des polices et changer le fonds d’écran, et les personnes aveugles utiliser un logiciel de reconnaissance vocale. Tout ceci est beaucoup plus difficile, sinon impossible, avec nombre d’autres formats. Dans une moindre mesure, le format HTML (hypertext markup language), destiné au web, et le format RTF (rich text format), destiné à l’échange de fichiers, sont également lisibles sur sur de nombreuses plateformes. -
12 bibliothèque
Les bibliothèques traditionnelles (bibliothèques nationales, bibliothèques publiques, bibliothèques privées, bibliothèques spécialisées, etc.) sont présentes sur l’internet par le biais d’un site web, d’un catalogue en ligne et d’une bibliothèque numérique, ce qui rend obsolètes les problèmes de communication du passé. Si la bibliothèque numérique se développe dès 1994, la mise en ligne de vastes collections ne débute que plus tard, en 1997 et 1998, le temps de numériser les fonds et de mettre au point la technologie nécessaire. Les documents sont numérisés en mode texte ou en mode image. D’autres bibliothèques numériques n’émanent pas d’une bibliothèque traditionnelle. Elles sont nées sur l’internet, comme le Projet Gutenberg, la grande bibliothèque mondiale de livres du domaine public au format texte. -
13 Bibliothèque électronique de Lisieux (La)
La Bibliothèque électronique de Lisieux est l’une des premières bibliothèques francophones du réseau. Elle est créée en juin 1996 par Olivier Bogros, directeur de la médiathèque municipale de Lisieux (Normandie), qui l’héberge pendant deux ans sur les pages de son compte personnel CompuServe. En juin 1998, il enregistre un nom de domaine (www.bmlisieux.com) et déménage l’ensemble sur un serveur offrant une capacité de stockage de 30 Mo (mégaoctets). En juillet 1999, la bibliothèque électronique comprend 370 textes courts, numérisés en mode texte à partir des collections de la médiathèque. On y trouve des oeuvres littéraires, des brochures et des opuscules documentaires, ainsi que des manuscrits, livres et brochures sur la Normandie. En juillet 2000, on compte 466 textes de 120 auteurs. En février 2004, les collections approchent les 700 textes. En décembre 2006, les collections comprennent 930 oeuvres et 20 galeries d’images (ce qui représente 327,1 Mo avec une capacité de stockage de 600 Mo). Créé en août 2000 sur le site de l’Université de Toronto, LexoTor est une base de données fonctionnant avec le logiciel TACTweb (TACT: text analysis computing tools) et permettant l’interrogation en ligne des oeuvres de la bibliothèque, ainsi que des analyses et des comparaisons textuelles.Voir aussi: bibliothèque numérique, Bogros, Olivier, numérisation, numérisation en mode texte, TACTweb.Le Dictionnaire du NEF > Bibliothèque électronique de Lisieux (La)
-
14 Bogros, Olivier
Olivier Bogros est directeur de la Médiathèque municipale de Lisieux (Normandie). En juin 1996, il crée la Bibliothèque électronique de Lisieux, une des premières bibliothèques francophones du réseau. Il l’héberge d’abord pendant deux ans sur les pages de son compte personnel CompuServe. En juin 1998, il enregistre un nom de domaine (www.bmlisieux.com) et déménage l’ensemble sur un serveur offrant une capacité de stockage de 30 Mo (mégaoctets). Cette bibliothèque numérique est spécialisée dans les textes courts (nouvelles, brochures et articles), qui sont numérisés en mode texte à partir des collections de la médiathèque, avec 700 textes en février 2004 et 930 textes en décembre 2006, ainsi que 20 galeries d’images. A titre personnel, Olivier Bogros est aussi l’auteur de Miscellanées, "une bibliothèque hétéroclite" présentant des nouvelles, textes, poèmes et chansons choisis par ses soins, avec mise à jour au minimum mensuelle. Miscellanées comprend 120 documents en février 2004 et 175 documents en décembre 2006.Voir aussi: Bibliothèque électronique de Lisieux, bibliothèque numérique, Miscellanées, numérisation, numérisation en mode texte. -
15 Distributed Proofreaders
(DP)Conçu en octobre 2000 par Charles Franks pour contribuer à la numérisation des livres du domaine public, Distributed Proofreaders (DP) est mis en ligne en mars 2001. Le concept est de permettre la correction partagée en fragmentant les livres en pages pouvant être relues par des correcteurs différents. Destiné à intensifier la production de livres pour le Projet Gutenberg, grande bibliothèque numérique mondiale au format texte, Distributed Proofreaders en devient rapidement la principale source. Il est officiellement affilié au Projet Gutenberg en 2002. La progression est rapide. En 2003, une moyenne de 250 à 300 relecteurs travaillant quotidiennement permet de produire entre 2.500 et 3.000 pages par jour, ce qui représente deux pages par minute. En 2004, la moyenne était de 300 à 400 relecteurs quotidiens produisant entre 4.000 et 7.000 pages par jour, à savoir quatre pages par minute. Distributed Proofreaders comptabilise un total de 3.000 livres en février 2004, 5.000 livres en octobre 2004, 7.000 livres en mai 2005, 8.000 livres en février 2006 et 10.000 livres en mars 2007. 700 volontaires se connectent chaque jour et 3.000 volontaires se connectent chaque mois. Les volontaires n’ont aucun quota à respecter. A titre indicatif, il est suggéré de relire une page par jour. Cela semble peu, mais une page multipliée par des milliers de volontaires représente un chiffre considérable. En janvier 2004 est lancé en parallèle Distributed Proofreaders Europe (DP Europe) pour alimenter le site du Projet Gutenberg Europe. -
16 Miscellanées
Miscellanées est “une bibliothèque hétéroclite” créée à titre personnel par Olivier Bogros, directeur de la Médiathèque municipale de Lisieux (Normandie) et fondateur en juin 1996 de la Bibliothèque électronique de Lisieux, une des premières bibliothèques francophones du réseau. Consacrée aux textes courts (nouvelles, poèmes et chansons), Miscellanées est conçue dès novembre 2000 (saisie de quelques textes) et mise en ligne en avril 2001. Elle s’enrichit de deux documents par mois en moyenne. On y trouve 120 textes en février 2004 et 175 textes en décembre 2006. Miscellanées fait partie du réseau du Net des études françaises (NEF).Voir aussi: Bibliothèque électronique de Lisieux, bibliothèque numérique, Bogros, Olivier, Net des études françaises, numérisation en mode texte. -
17 صيغة
texte; système; style; présente; présent; mode; modalité; manières; manière; locution; libellé; genre; formule; formulaire; formes -
18 text
1 nounCOMPUTING texte mtext block bloc m de texte;text buffer mémoire f tampon de texte;text editor éditeur m de texte;text field champ m de texte;text file fichier m texte;text layout disposition f de texte;TELECOMMUNICATIONS text message message texte m, mini-message m;text mode mode m texte;text processing traitement m de texte;text processor (unité f de) traitement de texte;text wrap habillage m du texteTELECOMMUNICATIONS envoyer un message texte ou un mini-message à -
19 text
text [tekst]1 noun(send text message to) envoyer un message texte ou un mini-message à(send text messages) envoyer des messages texte ou des mini-messages►► Computing text block bloc m de texte;Computing text buffer mémoire f tampon de texte;text editing édition f de texte, mise f en forme de texte;Computing text editor éditeur m de texte;Computing text field champ m de text;Computing text file fichier m texte;Computing text layout disposition f de texte;text linguistics linguistique f textuelle;text message (on mobile phone, pager) message m texte, mini-message m;Computing text mode mode m texte;Computing text processing traitement m de texte;Computing text processor (unité f de) traitement m de texte;Typography & Computing text wrap texte m en habillage -
20 OCR
(optical character recognition)La reconnaissance optique de caractères (OCR: optical character recognition, même sigle en français et en anglais) est une technologie permettant de convertir en fichier texte un fichier numérisé en mode image. Cette conversion permet d’alléger le poids du fichier, de corriger le texte si utile et d’effectuer des recherches textuelles. En quoi consiste exactement la numérisation d’un livre en utilisant un logiciel OCR? Il consiste à scanner le livre page après page, ce qui donne des fichiers numérisés en mode image, puis à utiliser un logiciel OCR, qui permet de convertir chaque fichier "image" en un fichier texte. Il consiste ensuite à relire le contenu du fichier texte au regard de l’original (image scannée ou livre imprimé) en corrigeant les erreurs (dix erreurs par page en moyenne quand le logiciel OCR est de qualité). Deux logiciels OCR commerciaux sont les logiciels OmniPage et TextBridge de la société Nuance.
См. также в других словарях:
Mode Texte — En informatique, le mode texte, par opposition au mode graphique, est un type d affichage sur écran constitué uniquement de caractères. Un écran d affichage en caractères est généralement composé de 40 ou 80 colonnes, et chaque commande ou action … Wikipédia en Français
Mode texte — Un mode texte en couleurs classique (EGA–VGA) En informatique, le mode texte, par opposition au mode graphique, est un type d’affichage sur écran constitué uniquement de caractères. Le mode texte a pour principal objet l implémentation d… … Wikipédia en Français
mode texte — ● loc. m. Fonctionnement du système avec seulement 256 caractères et symboles différents affichables à l écran, sans graphiques, sans image, mais avec, parfois, des interfaces pseudo graphiques fenêtrées bidouillées avec ces mêmes caractères … Dictionnaire d'informatique francophone
Navigateur Web En Mode Texte — La page d accueil de Wikipédia rendue par Links. Un navigateur en mode texte est un logiciel capable de visualiser des pages sur Web en mode texte, c’est à dire en affichant uniquement du texte, ce qui est très difficile : Internet et… … Wikipédia en Français
Navigateur web en mode texte — La page d accueil de Wikipédia rendue par Links. Un navigateur en mode texte est un logiciel capable de visualiser des pages sur Web en mode texte, c’est à dire en affichant uniquement du texte, ce qui est très difficile : Internet et… … Wikipédia en Français
Navigateur Web en mode texte — La page d accueil de Wikipédia rendue par Links. Un navigateur en mode texte est un logiciel capable de visualiser des pages Web en mode texte, c’est à dire en affichant uniquement du texte, ce qui est très difficile car le World Wide Web… … Wikipédia en Français
Environnement en mode texte — Un environnement en mode texte (TUI, de l anglais « Text User Interface », « Textual User Interface » ou encore «Terminal User Interface » est un rétronyme introduit dans le jargon informatique après l invention des… … Wikipédia en Français
Mode Graphique — Le mode graphique, par opposition au mode texte, est un type d affichage sur écran constitué de pixels, au lieu de caractères. Les pixels sont calés en 32 bits donc 4 octets par pixel C est le type d affichage le plus utilisé actuellement par les … Wikipédia en Français
Mode — Cette page d’homonymie répertorie les différents sujets et articles partageant un même nom. Pour l’article homophone, voir Mod. Sur les autres projets Wikimedia : « Mode », sur le … Wikipédia en Français
Mode graphique — Le mode graphique, par opposition au mode texte, est un type d affichage sur écran constitué de pixels, au lieu de caractères. Les pixels sont adressées individuellement sous forme de lignes et de colonnes dans un espace de couleurs prédéfinis,… … Wikipédia en Français
mode terminal — ● loc. m. ►EXEC Mode de fonctionnement d une application ou du système équivalent au mode texte de DOS, mais sous Unix … Dictionnaire d'informatique francophone